Política de Deriva Implícita: acciones en un paso con geometría condicional IDP: genera acciones en un paso con corrección del entrenamiento usando geometría condicional de experto. Ideal para control robótico de alta frecuencia. 2026-06-02 · 2 min